查看原文
其他

没有工具变量、断点和随机冲击,也可以推断归因

姜纬教授 计量经济圈 2019-06-30

请读到文章后面,有上一日的投票结果和批注。

哥伦比亚大学姜纬教授作演讲

来自哥伦比亚大学的姜纬教授带来了一场精彩的讲座--“Accomplishing Meaningful Inferences without Instruments, Discontinuity, and Random Shocks”(在不借助工具变量、断点回归和随机冲击的前提下如何完成有意义的推断)。

      首先,姜纬老师先从红酒和健康的例子出发,引出本场报告的主题。她提到简单回归发现,每天喝红酒的人身体更健康一些,从这个事实中我们可以得出什么结论?能否得出因为喝红酒所以身体更健康的结论?有人回答,不能。姜教授追问:从这个回归中,我们能够得到什么结论呢?观众积极响应:有人说有可能是因为健康的人喜欢喝红酒。

     “很好,”姜纬老师说,“这是一个反向的因果推断。”姜老师进一步解释:从回归结果中,我们仅仅知道喝红酒和健康状况存在显著的相关性,但是回归本身不能告诉我们两者之间是否存在因果关系。而建立因果关系是科研的重要意义所在。那么我们应该怎么做呢?通常应该借助工具变量,借助断点回归或者寻找随机冲击,来解决其中的内生问题。但是如果找不到这些工具,我们能不能完成一些有意义的学术研究呢?姜老师的讲座从六个方面阐述了如何不借助这些手段和技巧来进行一流的实证研究。

(一)处理效应并不是唯一有趣的经济学问题

平均处理效应(average treatment effect, ATE)是当前经济/金融研究中最受推崇的推断方法。但由于条件苛刻,在大多数情况下并不能实现,使得ATE并不能发挥作用。但是我们可以通过选择效应(selection effect)来帮助我们达成目的。

例如在Jiang, Nelson, and Vytlacil (2014, RFS)的研究中,使用某个主要的全国性的住房抵押贷款银行的数据,研究了证券化与贷款业绩表现之间的关系。以往的研究发现筛选努力与事前的贷款销售概率之间存在负相关性。与此不同,这篇论文发现从事后而言,银行资产负债表上留存的贷款比出售的贷款有更高的不良比率。这似乎和我们的直觉相反。为什么会得到这样的结果呢?这篇论文明确区分贷款业绩与贷款出售之间的事前事后关系。事前关系是银行在决定是否发起贷款时所认为的关系,事后关系适用于贷款发起和出售期间的关系。事前事后产生了相反的结论,主要是因为投资者存在选择效应,只有质量好的贷款才能在二级市场出售,因而导致了如此关系。


另一个例子是来自Mulligan and Rubinstein(2008, QJE)的关于“女性相对工资”研究,该项研究发现,1970年到1990年,性别间的平等程度变化线(用女性工资中位数除以男性工资中位数来表示)与性别内的不平等程度变化线(用90分位的男性工资除以10分位的男性工资表示)趋势是一致的。为什么会产生这种现象呢,这是因为选择效应的存在,当女性逐步进入劳动力市场时,只有聪明的女性在与男性的竞争中能够在劳动力市场上留下来,数据不能观测到未参与工作的女性,因而导致了这个现象的存在。

(二) 配对固定效应

什么是固定效应,固定效应有什么好处呢?在大多数面板数据中,固定效应都可以吸收大部分随时间不变的内生性,但并不能处理随时间变化的内生性。固定效应在处理内生性匹配层面表现除了相当强大的力量,但是需要提前分类数据。在Jiang, Wan, and Zhao(2016, RFS)的研究中,当董事会组成和会议议程都是内生的时候,可以对董事会的分歧做出解释吗?除非个体的投票数据是可以采用的,然后内生性匹配就可以通过固定效应被吸收掉。

多维的固定效应可以作为控制变量完备集合的替代。有的研究甚至只有一个回归元,例如Fisman, Paravisini, and Vig (2017, AER),文章的表四只包含了一个“Same Group”回归元,通过使用的是来自印度银行的办公人员和借款人的宗教、种族的二元匹配数据,借此来表明,贷款人和借款人之间的文化接近度(共同的守则、信仰和种族等)增加了信贷的数量,并减少了还款违约。


如果不平衡集群的原因和内生性有关,那么固定效应可能会失效,这时候可以通过寻找一个共同的比较对象来解决。比如说,现在要选择一个学生,有两个对象可供选择,都是财大的,一个来自经济学院,GPA为3.6;另一个是金融学院,GPA为3.7,给定这些信息我应该怎么选,有同学愿意回答一下吗?似乎没法选,因为两个同学来自不同的群体,GPA的直接比较不再具有参考性。但假设两个同学之间有一个可以共同比较的同学,是不是这两个同学就建立了间接的关系?在Brav, Jiang, Li (2017; early stage)关于投票代理权角逐中对冲基金与机构投资者的关系研究中就作出了这样的处理。研究发现,基金并不会在所有的代理权争夺事件中投出自己的一票;Pro-Activist衡量方法在不同事件中没有可比性;任何两只基金都可以在他们参与投票的代理权争夺事件的基础上进行比较;基金的相对排名可以通过两两比较的方法进行分类。

(三) 从预先确定的敞口中进行识别

在法律或政策变化方面的双重差分(DID)分析很常见,然而法律或政策变化几乎不是随机的。预先确定的政策敞口变化可能是一个挽救办法。

一方面可以借助与政策变化合规程度(Distance to compliance)层面来探讨。在Chhaochharia and Grinstein (2007, JF)的研究中探讨了2001年至2002年的公司丑闻导致了“萨班斯法案”的影响。丑闻发生后,美国证券交易所对于规定进行了多处修改。研究发现这些规定的宣告对公司价值有重大影响。与更符合规定的公司相比,较不符合规定条款的公司能够获得正的超额收益。同样在Ahern and Dittmar (2012, QJE)关于董事会多样化的研究中提到,2003年一项新法律规定要求挪威公司董事中40%必须是女性--当时公司内只有大约9%的董事是女性。通过使用女性董事会代表的变化作为配额之后公司董事会变化的工具变量,研究发现,法律公布后,女性董事配额所引起的约束导致了公司股价大幅下滑,并且随后几年内托宾Q也大幅下滑,符合企业选择董事会实现价值最大化的理念。因为配额导致董事会平均年龄变小,经验更不足,杠杆和收购增加,经营业绩恶化。

另一方面可以借助交错周期(Pre-staggered cycles)层面来探讨。在Fos, Li, and Tsoutsoura (2017, RFS forthcoming)的研究中,通过借助选举年份变化,探讨了董事长选举与CEO周转率敏感性之间的关系,当董事会越接近下一次选举时,CEO周转率-表现-敏感度越高。在Shue and Townsend (2017, JF)的研究中探讨了股票期权如何影响CEO的风险承担,为了克服期权授予的内生性,通过利用多年度补偿计划的制度特征,在新的实值期权的大幅增加的时间点上产生了两种截然不同的变化类型。 研究发现,给定样本期间的平均授予水平,授予的新期权增加10%将导致股票波动幅度增长2.8-4.2%。


当然,也可以通过一些事前敞口(Ex ante exposure)来探讨。这里的例子在中国很不适用,中国的父母需要负担自己孩子上学甚至以后买房子的开销,而大部分美国父母不会如此,因此许多学生上学会负担债务。在Fos, Liberman, and Yannelis (2017)的研究中,当学校学费增加的时候,低年级的学生比高年级学生未来的研究生入学率会降低,因为他们承担了更多的债务。在Lucca, Nadauld, Shen (2017, RFS R&R)的研究中,当学生通过贷款资助他们的教育时,贷款和学费的变化是相互关联的。较高的学费成本提高了学生的贷款需求,但是同时贷款供给也会影响到学费,例如通过放宽学生的资金限制,因而产生了内生性,为了克服这个联立方程问题,通过建立规则的敞口来识别贷款供给对学费变化的影响。

(四) 反驳可能存在的其他假说

在Brav, Jiang, and Kim (2015, RFS)的研究中,用企业层面的数据来描述对冲基金主动干预的实际影响,研究发现共同基金干预企业三年后,企业的生产效率明显改善,但是应该怎么处理对冲基金主动干预的内生性呢?姜老师和她的合作者们并没有直接证明,而是通过驳斥各个可能的替代假设(包括管理层自愿改革假说,行业冲击假说和对冲基金股票选择假说)来证明他们自己提出的假设的正确性。姜老师提到,这篇文章在提交杂志审稿前,已经在40个会议上被宣讲和讨论,听众提出的问题使得他们的论文能够不断提高和优化。


(五)随机时间

大多数时间发生并不是随机的,但是发生的确切时间点是有时是随机的。这类似于停止时间模型,倾向不是随机的,但是确切的时间是随机的。如果结果取决于实际的行动,那么随机时间起作用;如果结果是取决于隐藏的行动,则随机时间不起作用。

例如,在医学研究中,最重要被治疗但是现阶段未被治疗的个体可以作为现阶段被治疗个体的对照。在Brav, Jiang, Ma, and Tian (2017, JFE R&R)的研究中提到,专利从申请到批准的周期中位数为2.5年,方差为为1.5年。专利被授权的确切时间并不在activist掌控之下,activist也并不拥有专利授权确切日期的超前信息,因而专利被授权的日期就是随机的时间。因而,对于activist所瞄准的在[t-48,t-1]个月期间提交的专利与在[t-6,t + 6]个月内被批准的专利可能是在非常类似的情况下产生。

(六)进入“因果关系”黑匣子

通常来讲,我们不能断定“X导致Y”因为我们仅仅观察到了X与Y,并没有观察到二者之间的作用过程。目前,已经有很多研究开始走入黑匣子内部来揭示影响机制。例如Schwartz-Ziv and Weisbach (2013, JFE)通过研究董事会的会议记录来评估了董事会的工作模式,管理模式还是监督模式,通过分析董事会会议花在“管理”和“监督”议程上的讨论时间来作出推断,以此揭示了董事会工作模式的黑匣子。同样在Jiang, Li, Mei (2017, JF R&R)关于基金活动家套利是否导致交易失败的研究中,通过分析可能导致交易失败的各种原因挨个筛选,最后揭示出真正的影响机制,而不是借助工具变量来解决内生性。

姜纬老师的报告深入浅出,通过生活相关的案例来说明理论问题,又通过实际的研究实例来讲解遇到具体问题的解决办法,使得每种方法的讲解更为生动有趣。
注:此文来源于@上海财经大学金融学院。



2017/07/24日投票结果展示

   上图为主成分分析和因子分析 PC, FA 及运行结果 文中的“关注计量经济学圈的你是什么身份呢?”问题投票结果。不排除因为样本会出现“选择偏差”,从而导致这个投票结果的分布出现误差,但至少我们可以知道,关注@计量经济学圈并以文互动比较集中的,是在硕士研究生到讲师/助理教授圈子里。从中可以看出,计量经济学对于本科生而言依然没有其他经济学科受到欢迎,这可能跟他们不需要写论文做实证研究有很大关系;而博士研究生和刚博士毕业不久到高校任教的青年教师,则往往更倾向于通过计量工具的学习,来做出实质性的科研成果。

@计量哥认为,文章更重要的部分一定是“讨论”部分,怎么对回归结果进行解释,要么通过固有理论,要么通过新的角度修补理论,这才是一个检验是否受过正统经济学思维训练的砝码。一般而言,只有当我们的回归结果不显著或者不符合我们的预期时,我们才会去看看是不是模型设定有偏差,或者是不是数据里有极端值,又或者是不是有共线性、异方差、自相关、内生性、不平稳等特殊问题出现。其实,在一般的实证分析当中,我们是不太可能去依次检查上面提到的问题的,除非有些回归系数的符号与理论出现偏差;而一旦检查了上面提及的这些问题但没有发现任何异常后,我们就需要通过部分修正理论或数据来重新解释这个回归结果。

大多数情况下,真正通过计量工具操作回归结果的那个人并不需要太多的经济学知识,而设定一个合理模型和对回归结果做出解释的那个人却才是里面的核心人物,这也就是为什么我们需要一而再再而三地学习那些看起来无用的经济学理论的主因。



请参与这个投票,希望更多人表达想法。


注:很多时候,你、我都会犯错,请善意地批评。耽误你的宝贵时间,可能是浪费在了这个投票上,但是participation是最好的交流。也请诸位多多转发、推介以支持。


@计量经济学圈


记录一个我们生活在其中的时代社会,一个非常具有潜力的深度与客观兼具的大号,囊括的主题如下:经济、社会、历史、新闻、世界、计量工具。



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存